10 research outputs found

    NUMA impact on network storage protocolsover high-speed raw Ethernet

    Get PDF
    Proceedings of: Second International Workshop on Sustainable Ultrascale Computing Systems (NESUS 2015). Krakow (Poland), September 10-11, 2015.Current storage trends dictate placing fast storage devices in all servers and using them as a single distributed storage system. In this converged model where storage and compute resources co-exist in the same server, the role of the network is becoming more important: network overhead is becoming a main imitation to improving storage performance. In our previous work we have designed Tyche, a network protocol for converged storage that bundles multiple 10GigE links transparently and reduces protocol overheads over raw Ethernet without hardware support. However, current technology trends and server consolidation dictates building servers with large amounts of resources (CPU, memory, network, storage). Such servers need to employ Non-Uniform Memory Architectures (NUMA) to scale memory performance. NUMA introduces significant problems with the placement of data and buffers at all software levels. In this paper, we first use Tyche to examine the performance implications of NUMA servers on end-to-end network storage performance. Our results show that NUMA effects have significant negative impact and can reduce throughput by almost 2x on servers with as few as 8 cores (16 hyper-threads). Then, we propose extensions to network protocols that can mitigate this impact. We use information about the location of data, cores, and NICs to properly align data transfers and minimize the impact of NUMA servers. Our design almost entirely eliminates NUMA effects by encapsulating all protocol structures to a “channel” concept and then carefully mapping channels and their resources to NICs and NUMA nodes.We thankfully acknowledge the support of the European Commission under the 7th Framework Programs through the NanoStreams (FP7-ICT-610509) project, the HiPEAC3 (FP7-ICT-287759) Network of Excellence, and the COST programme Action IC1305, ’Network for Sustainable Ultrascale Computing (NESUS)’

    Improving I/O performance through an in-kernel disk simulator

    Get PDF
    This paper presents two mechanisms that can significantly improve the I/O performance of both hard and solid-state drives for read operations: KDSim and REDCAP. KDSim is an in-kernel disk simulator that provides a framework for simultaneously simulating the performance obtained by different I/O system mechanisms and algorithms, and for dynamically turning them on and off, or selecting between different options or policies, to improve the overall system performance. REDCAP is a RAM-based disk cache that effectively enlarges the built-in cache present in disk drives. By using KDSim, this cache is dynamically activated/deactivated according to the throughput achieved. Results show that, by using KDSim and REDCAP together, a system can improve its I/O performance up to 88% for workloads with some spatial locality on both hard and solid-state drives, while it achieves the same performance as a ‘regular system’ for workloads with random or sequential access patterns.Peer ReviewedPostprint (author's final draft

    Proyecto Tetris: aprendizaje de la programación en ensamblador por piezas

    Get PDF
    El aprendizaje del lenguaje ensamblador constituye con frecuencia uno de los objetivos formativos de alguna de las primeras asignaturas de Arquitectura de Computadores del Grado en Ingeniería Informática. Si bien el desarrollo y la depuración de programas en lenguaje ensamblador resultan esenciales para ayudar a comprender el funcionamiento básico de un procesador, son aspectos que presentan especial dificultad y/o falta de atractivo para el alumnado. En este trabajo presentamos nuestra experiencia con la enseñanza del lenguaje ensamblador MIPS a través de la codificación del videojuego Tetris. El proyecto Tetris se desarrolla en el contexto de una asignatura de primer curso y segundo cuatrimestre. Para que resulte asequible a este nivel, se proporciona al alumno una versión incompleta del programa, que habrá de completar mediante la traducción directa a ensamblador de funciones escritas en lenguaje C (también proporcionadas), y mediante la codificación del resto de la funcionalidad directamente en ensamblador. El resultado es una versión del juego plenamente operativa. El desarrollo se realiza utilizando una versión extendida del simulador MARS. Los resultados obtenidos por los alumnos muestran que este proyecto les facilita el aprendizaje del ensamblador, pues el 85.6% de los que superan el proyecto Tetris aprueban también el examen de prácticas.Learning assembly language represents typically one of the formative objectives of some of the first courses related to computer architecture in Computer Engineering degrees. Although the development and debugging of programs written in assembly language are essential to help students understand the basic operation of a processor, they are also aspects that present special difficulty and/or lack of attractiveness for students. In this work we present our experience in the teaching of the MIPS assembly language through the coding of the videogame Tetris. The Tetris project is developed in the context of a first-year and second-term course. In order to be affordable at this level, the student is provided with an incomplete version of the program, which must be completed through the direct translation to the MIPS assembly language of functions written in the C language (also provided), and through the implementation of additional functionality directly in assembly language. The result is a fully operational version of the game. The development is done using an extended version of the MARS simulator. The results obtained by the students show that this project facilitates the learning of the assembly, since 85.6% of those who pass the Tetris project also pass the practicum exam

    Simulación concurrente y elección dinámica de estrategias para la mejora de la entrada/salida de disco = Improvement of disk I/O by concurrent simulation and dynamic selection of strategies

    No full text
    A lo largo de los años, se han realizado avances muy importantes en la tecnología de los discos, y se han hecho amplias mejoras en los dispositivos de disco. Sin embargo, el rendimiento de la memoria y la CPU ha mejorado a una mayor velocidad. Como consecuencia, el rendimiento del sistema de disco domina, normalmente, el redimiendo global de todo un sistema, y limita el rudimento que muchas aplicaciones (especialmente, las aplicaciones que usan muchos datos) pueden alcanzar. En esta tesis, hemos centrado nuestra atención en mejorar el rendimiento de la entrada/salida (E/S), con la motivación de que un mejor rendimiento de E/S normalmente mejorará el rendimiento global del sistema. La tres principales contribuciones hechas para alcanzar este objetivo son las siguientes. Nuestra primera propuesta es un «proyecto de caché de disco mejorada mediante RAM» (REDCAP, RAM Enhanced Disk Cache Project), que agranda la caché de un dispositivo de disco usando parte de la memoria principal. Para conseguir tal fin, añadimos una nuevo nivel a la jerarquía de caché, entre la caché de páginas y la caché de disco. Además, introducimos una técnica de prefetching que se beneficia del mecanismo de lectura anticipada realizado por los discos modernos, y se aprovecha de las peticiones de lectura lanzadas por las aplicaciones. Completamos esta primera propuesta con un mecanismo para controlar el rendimiento alcanzado por la nueva caché. Gracias a REDCAP, somos capaces de reducir el tiempo de E/S de lectura en más de un 80% en cargas de trabajo con localidad espacial, sin degradar el redimiendo para otras cargas de trabajo. Como una manera de conseguir un subsistema de E/S que se auto--monitorice y auto-adapte, nuestra segunda propuesta es un «simulador de disco dentro del núcleo» que es capaz de simular tanto discos duros como discos de estado sólido. Nuestro simulador de disco modela el disco usando una tabla dinámica de tiempos de E/S; también simula una caché de disco interna. El simulador controla la llegada de las peticiones y las dependencias entre peticiones, y tiene en cuenta los tiempos de pensar entre peticiones. Nuestro simulador de disco tiene un planificador de E/S que establece el orden en el que las peticiones se enviarán a disco. Esta propuesta nos permite comparar, en tiempo real, el comportamiento de varios mecanismos de E/S y, dinámicamente, activarlos/desactivarlos dependiendo del rendimiento esperado. De hecho, nuestro simulador ha sido usado de forma satisfactoria en REDCAP para controlar su rendimiento y en nuestra tercera contribución para implementar un sistema de planificación dinámico. También abre la puerta a nuevas mecanismos de E/S auto--monitorizables y auto--adaptables. Nuestra última propuesta es un «marco de planificación de disco automático y dinámico» (DADS, Dynamic and Automatic Disk Scheduling framework). Este mecanismo selecciona el planificador de E/S que proporciona, para la carga de trabajo actual, el mayor rendimiento. DADS compara dos de los planificadores de E/S de Linux ejecutando, de forma simultánea, una instancia de nuestro simulador de disco para cada planificador. Entonces elige, en cualquier momento, el planificador de E/S que proporciona el menor tiempo de servicio para la misma cantidad de datos solicitados. Usando DADS, el rendimiento alcanzado está siempre cercano al obtenido por el mejor planificador; también los administradores de sistemas están exentos de elegir un planificador de E/S que no sea óptimo y que proporcione un buen comportamiento para algunas cargas de trabajo, pero que degrade el rendimiento del sistema cuando la carga de trabajo cambia

    Rivalizar o no: análisis del modo competición de Wooclap basado en rendimiento y procesamiento de audio

    Get PDF
    Este artículo presenta los resultados de aplicar, en una asignatura del Grado en Ingeniería Informática, distintos modos de uso para un sistema interactivo de respuesta. En el estudio se ha usado la plataforma Wooclap, la cual permite lanzar preguntas a los estudiantes para que las contesten en el aula mediante sus dispositivos móviles. Se ha diseñado una experiencia en la que se analizan dos usos de la plataforma: sin competición y con competición basada en puntos. Para ello, se han empleado dos grupos disjuntos de estudiantes que han respondido, en pruebas distintas guiadas por el mismo docente, a las mismas preguntas pero empleando modos de uso distintos en cada caso. Esta investigación cuasi-experimental toma como fuentes de datos el rendimiento de los estudiantes en dichas pruebas (preguntas acertadas correctamente) y el nivel de interacción general en el aula durante el desarrollo de las mismas. Hemos empleado un sistema de análisis de las grabaciones de audio efectuadas, basado en el uso de inteligencia artificial, para caracterizar la participación de los distintos actores. Los resultados obtenidos muestran que, dependiendo de la modalidad, hay patrones distintos en el nivel de interacción de los estudiantes durante las pruebas. Sin embargo, los resultados también indican que la modalidad usada no influye en el rendimiento obtenido por los estudiantes.This paper presents the results of applying, in a subject of the Degree in Computer Science, different modes of use for an interactive response system. The study used the Wooclap platform, which allows the teacher to prompt questions to the students to be answered in class using their mobile devices. An experience has been designed in which two different uses of the platform were analyzed: without competition and with point-based competition. Two separate groups of students answered, in different tests guided by the same teacher, the same questions but using different modes of use in each case. This quasi-experimental research takes as data sources the performance of the students in these tests (questiones correctly answered) and the general level of interaction in the classroom. We have used an AI-based audio recording analysis system to characterize the participation of different actors. The results obtained show that, depending on the mode, there are different patterns in the level of interaction of the students during the tests. However, the results also indicate that the mode used does not influence the performance obtained by the students

    The RAM Enhanced Disk Cache Project (REDCAP)

    No full text
    This paper presents the RAM Enhanced Disk Cache Project, REDCAP, a new cache of disk blocks which reduces the read I/O time by using a small portion of the main memory. The essential ideas behind REDCAP are to enlarge the built–in cache of the disk drive, imitate its behavior, and take advantage of its read–ahead mechanism by prefetching disk blocks. REDCAP is intended to be I/O– time efficient, and implements an activation–deactivation algorithm which turns its cache on and off dynamically depending on the I/O time improvement achieved. REDCAP has been implemented in the Linux kernel. The experimental results show that our proposal reduces the application time by up to 80 % for workloads which exhibit some spatial locality, while it has the same performance as a traditional system for those workloads which have a random access pattern, or perform large sequential reads

    A microcomputer based data acquisition and processing system for tensile testing specimens with or without the aid of extensometry

    Get PDF
    SIGLEAvailable from British Library Document Supply Centre- DSC:3106.052(OED/STB(S)--87/0009/N) / BLDSC - British Library Document Supply CentreGBUnited Kingdo

    Evaluating the effectiveness of REDCAP to recover the locality missed by today's Linux Systems

    No full text
    In order to know how different conditions influence the behavior of the RAM Enhanced Disk Cache Project (REDCAP), we have analyzed the impact of the file system and the REDCAP cache size. The results show that, for workloads which exhibit some spatial locality, the application time can be reduced by more than 80% for file systems that split the disk into block groups, while for those that do not use this division the reduction can be more than 55%. REDCAP has the same performance as a traditional system for those workloads with a random or sequential access pattern. The experiments also show that the cache size can determine the results, depending on the file system and the number of processes.Peer Reviewe

    Improving I/O performance through an in-kernel disk simulator

    No full text
    This paper presents two mechanisms that can significantly improve the I/O performance of both hard and solid-state drives for read operations: KDSim and REDCAP. KDSim is an in-kernel disk simulator that provides a framework for simultaneously simulating the performance obtained by different I/O system mechanisms and algorithms, and for dynamically turning them on and off, or selecting between different options or policies, to improve the overall system performance. REDCAP is a RAM-based disk cache that effectively enlarges the built-in cache present in disk drives. By using KDSim, this cache is dynamically activated/deactivated according to the throughput achieved. Results show that, by using KDSim and REDCAP together, a system can improve its I/O performance up to 88% for workloads with some spatial locality on both hard and solid-state drives, while it achieves the same performance as a ‘regular system’ for workloads with random or sequential access patterns.Peer Reviewe
    corecore